本小节演练如何在BitaHub上,通过简单的几步运行一个算法项目:
三个步骤
- 创建项目
- 运行任务
- 查看结果
1. 创建项目
- 点击创建项目打开项目创建页面,填写项目名称,比如我们命名为
DogVSCat
; - 编程语言我们用的是Python3.6,算法框架我们用的是PyTorch1.0,依次选择;
- 点击选择数据集按钮,在弹出框里,搜索选择
DogVSCat
数据集; - 点击模型下拉框,选择公开模型,在弹框中选择
ResNet
模型; - 点击上传代码按钮,将前一个小节我们提供的代码解压后上传;
- 点击创建项目,即可完成项目的创建,系统完成创建后,会自动跳转到运行任务;
2. 创建任务
进入创建任务界面后,系统会默认设定一个配置,这里我们就用推荐配置即可;
启动命令文本框,是用于输入我们任务的
启动命令
,在本次的演示项目中,我们输入指令如下:python dogcat_train.py --arch resnet34 --model /model/bitahub/ResNet/resnet34.pth --train_dataset /data/bitahub/DogVsCat/train --trainval_dataset /data/bitahub/DogVsCat/trainval
其中:
代码文件是
dogcat_train.py
,后面附带参数选项:--arch:代表网络结构;
--model:代表本次选择的模型文件路径;
--train_dataset和--trainval_dataset:分别代表训练集和验证集的文件路径;
点击保存并运行任务按钮,即可提交本次运行任务;
3. 查看结果
在上一步骤提交运行任务后,系统会跳转到该项目的任务列表,这里会展示本项目所有的运行任务:
从上图中点击本次任务的查看
按钮,进入任务详情页面:
在上图中,我们可以看到任务配置和运行过程中生成的日志,你也可以切换到图表
界面,查看任务运行过程中的资源使用情况;
4. TensorBoard可视化分析
BitaHub平台中运行的任务,可以通过TensorBoard来进行可视化分析,需要如下操作:
- 在代码中使用tensorboardX(或pytorch中的torch.utils.tensorboard)将数据写入到指定目录
/output/logs
中; - 在任务列表界面的操作菜单点击TensorBoard按钮查看;
关于TensorBoard面板如何使用,参考文档:https://www.tensorflow.org/tensorboard?hl=zh-cn